检索结果

Select

1. 联合分层注意力网络和独立循环神经网络的地域欺凌识别

孟曌, 田生伟, 禹龙, 王瑞锦

计算机应用 2019, 39 (8): 2450-2455. DOI: 10.11772/j.issn.1001-9081.2019010033

摘要（510）

PDF （983KB）（280）

为提高对文本语境深层次信息的利用效率，提出了联合分层注意力网络（HAN）和独立循环神经网络（IndRNN）的地域欺凌文本识别模型——HACBI。首先，将手工标注的地域欺凌文本通过词嵌入技术映射到低维向量空间中；其次，借助卷积神经网络（CNN）和双向长短期记忆网络（BiLSTM）提取地域欺凌文本的局部及全局语义特征，并进一步利用HAN捕获文本的内部结构信息；最后，为避免文本层次结构信息丢失和解决梯度消失等问题，引入IndRNN以增强模型的描述能力，并实现信息流的整合。实验结果表明，该模型的准确率（Acc）、精确率（P）、召回率（R）、F1和AUC值分别为99.57%、98.54%、99.02%、98.78%和99.35%，相比支持向量机（SVM）、CNN等文本分类模型有显著提升。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于纹理指纹与活动向量空间的Android恶意代码检测

罗世奇, 田生伟, 禹龙, 于炯, 孙华

计算机应用 2018, 38 (4): 1058-1063. DOI: 10.11772/j.issn.1001-9081.2017102499

摘要（467）

PDF （862KB）（401）

为了进一步提高恶意代码识别的准确率和自动化程度，提出一种基于深度学习的Android恶意代码分析与检测方法。首先，提出恶意代码纹理指纹体现恶意代码二进制文件块内容相似性，选取33类恶意代码活动向量空间来反映恶意代码的潜在动态活动。其次，为确保分类准确率的提高，融合上述特征，训练自编码器（AE）和Softmax分类器。通过对不同数据样本进行测试，利用栈式自编码（SAE）模型对Android恶意代码的分类平均准确率可达94.9%，比支持向量机（SVM）高出1.1个百分点。实验结果表明，所提出的方法能够有效提高恶意代码识别精度。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于栈式自编码的水体提取方法

王知音, 禹龙, 田生伟, 钱育蓉, 丁建丽, 杨柳

计算机应用 2015, 35 (9): 2706-2709. DOI: 10.11772/j.issn.1001-9081.2015.09.2706

摘要（501）

PDF （619KB）（13070）

为了进一步提高利用遥感图像进行水体提取的准确率和自动化程度,提出一种基于栈式自编码(SAE)深度神经网络的水体提取方法。通过堆叠稀疏自编码器构建深度网络模型,使用逐层贪婪训练法依次训练每层网络,从像素层面无监督学习特征,避免传统神经网络等方法需进行人工特征分析与选取的问题;用学习到的特征结合相应的样本标签有监督训练softmax分类器;利用反向传播(BP)算法微调优化整个模型。采用塔里木河ETM+数据进行实验,基于SAE的水体提取方法准确率达到94.73%,比支持向量机(SVM)和反向传播(BP)神经网络方法分别高出3.28%和4.04%。实验结果表明,所提方法能有效提高水体提取的精度。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于一致性Hash的分布式海量分子检索模型

孙霞, 禹龙, 田生伟, 闫奕霖, 林江丽

计算机应用 2015, 35 (4): 956-959. DOI: 10.11772/j.issn.1001-9081.2015.04.0956

摘要（536）

PDF （581KB）（530）

针对大数据环境下,传统通用图匹配检索低效、折射率数据无法快速定位的问题,建立了基于一致性Hash的分布式海量分子检索模型。模型结合分子特点,将连续的折射率通过等宽算法离散化建立高速Hash索引,实现分布式海量分子检索系统,有效减小了参与计算的分子数据规模,并根据分子访问频次处理冲突从而提高分子检索效率。实验结果表明,在包含20万个分子的数据中,该方法平均检索耗时约为通用图匹配平均检索耗时的5%,模型性能稳定,具有高可扩展性;对于海量数据环境下依据折射率检索高频次分子较为适用。

参考文献 | 相关文章 | 多维度评价

Select

5. 云计算环境下对资源聚类的工作流任务调度算法

郭凤羽禹龙田生伟于炯孙华

计算机应用 2013, 33 (08): 2154-2157.

摘要（856）

PDF （614KB）（543）

针对云计算环境中资源具有规模庞大、异构性、多样性等特点，提出了一种对资源进行模糊聚类的工作流任务调度算法。经过对网络资源属性进行量化、规范化，以预先构建的任务模型和资源模型为基础，结合模糊数学理论划分资源，使得在任务调度时能够较准确地优先选择综合性能较好的资源类簇，缩短了任务资源相匹配的时间，提高了调度性能。通过仿真实验将此算法与HEFT、DLS进行比较，实验结果表明，当任务在[0,100]范围增加时，该算法平均SLR比HEFT小34%，比DLS小99%，其平均Speedup比HEFT大59%，比DLS大102%；当资源在[0,100]范围增加时，该算法平均SLR比HEFT小36%,比DLS小97%，其平均Speedup比HEFT大45%，比DLS大108%。所提算法实现了对资源的合理划分，且在执行跨度方面具有优越性。

参考文献 | 相关文章 | 多维度评价

Select

6. 面向维吾尔语文本的改进后缀树聚类

翟献民田生伟禹龙冯冠军

计算机应用 2012, 32 (04): 1078-1081. DOI: 10.3724/SP.J.1087.2012.01078

摘要（1210）

PDF （600KB）（402）

针对后缀树聚类选取基类时，基类短语出现信息不规范、重复和冗余的问题，提出了一种改进后缀树聚类算法。该算法首先以短语互信息算法改进基类的选取，选出遵守维吾尔语语法规则的基类短语；然后，利用短语归并算法对选取的重复基类短语进行归并；最后，在前两步的工作基础上，利用短语去冗余算法处理冗余的基类短语。实验证明，与传统后缀树聚类(STC）相比，改进后缀树聚算法的全面率、准确率都得到了提高。这表明，改进算法有效地改善了聚类效果。

参考文献 | 相关文章 | 多维度评价

Select

7. Web文本中维吾尔语领域术语的自动发现

钟军田生伟禹龙

计算机应用 2012, 32 (02): 407-410. DOI: 10.3724/SP.J.1087.2012.00407

摘要（975）

PDF （599KB）（363）

针对维吾尔语领域术语获取难度大,人工扩充领域术语工作量大、效率低等特点，利用词汇共现原理，以维吾尔语连接词和互信息(MI)为工具，快速扩充原始维吾尔语领域术语;建立了以维吾尔语领域术语为特征模板，利用条件随机场(CRF)模型实现Web文本中维吾尔语领域术语的自动发现方法，并在此基础上实现长维吾尔语领域术语的自动发现。实验表明，对短维吾尔语领域术语的自动发现准确率为 97.59%，召回率为 93.38%，对长维吾尔语领域术语的自动发现正确率达到55.72%。

参考文献 | 相关文章 | 多维度评价